13.4 비지도 스킬 발견 (Unsupervised Skill Discovery)
- 13.4 비지도 스킬 발견 (Unsupervised Skill Discovery)
- 13.4.1 보상 없는 학습: 외부 보상 없이 환경과 상호작용하며 유의미한 행동(Skill)을 스스로 학습하는 메커니즘
- 13.4.2 상호정보량(Mutual Information) 최대화: 상태(State)와 잠재 변수(Latent Variable) 간의 의존성을 이용한 스킬 분화 (DIAYN, VIC 등)
- 13.4.3 동역학 기반 스킬 학습 (Dynamics-Aware Discovery): DADS(Dynamics-Aware Discovery of Skills)와 모델 기반 접근법